VP4 0_EBV 



ID VP4 0_EBV Reviewed; 6 05 AA. 

AC P03234; 

DT 21-JUL-1986, int egrat ed 

DT 21-JUL-1986, sequence version 1. 

DT 24-JUL-2007, entry version 64. 

DE Capsid protein P40 (Virion structural protein BVRF2) (EC-RF3 and EC- 

DE RF3A) [Contains: Capsid protein VP24 ( Assemblin ) (Protease) 

DE (EC 3.4.21.97); Capsid protein VP22A; C-terminal peptide]. 

GN ORFNames=BVRF2 ; 

OS Epstein-Barr virus (strain B95-8) (HHV-4) (Human herpesvirus 4). 

OC Viruses; dsDNA viruses, no RNA stage; Herpesviridae ; 

OC Gammaherpesvirinae ; Lymphocryptovirus . 

OX NCBI_TaxID=103 77; 

OH NCBI_TaxID=9606; Homo sapiens (Human) . 

RN [1] 

RP NUCLEOTIDE SEQUENCE [GENOMIC DNA] . 

RX MEDLINE=85 035 713; PubMed=6 0 9 2 8 2 5 ; 

RA Bankier A.T., Deininger P . L . , Farrell P.J., Barrell B.G.; 

RT "Sequence analysis of the 17,166 base-pair EcoRI fragment C of B95-8 

RT Epstein-Barr virus."; 

RL Mol. Biol. Med. 1:21-45(1983). 

RN [2] 

RP NUCLEOTIDE SEQUENCE [LARGE SCALE GENOMIC DNA] . 

RX MEDLINE=8 42 7066 7; PubMed=6 0 8 7149 ; DOI=10 . 1038/310 207a0 ; 

RA Baer R., Bankier A.T., Biggin M.D., Deininger P.L., Farrell P.J., 

RA Gibson T.J., Hatfull G., Hudson G.S., Satchwell S.C., Seguin C, 

RA Tuffnell P.S., Barrell B.G.; 

RT "DNA sequence and expression of the B95-8 Epstein-Barr virus genome . " ; 

RL Nature 310:207-211(1984). 

CC -!- FUNCTION: VP22A is a component of the capsid core involved in 
CC processing and packaging of progeny DNA. VP24 is a protease which 

CC can proteolytically cleave itself and VP22A at the C-terminus (By 

CC similarity) . 

CC -!- CATALYTIC ACTIVITY: Cleaves -Ala- | -Ser- and -Ala- | -Ala- bonds in 
CC the scaffold protein. 

CC -!- ALTERNATIVE PRODUCTS: 

CC Event=Alternative initiation; Named isoforms=2; 

CC Name=EC-RF3 ; 

CC IsoId=P0323 4-l; Sequence=Displayed; 

CC Name=EC-RF3A; 

CC IsoId=P0323 4-2; Sequence=VSP_018 865; 

CC -!- SIMILARITY: Belongs to the peptidase S21 family. 

CC 

CC Copyrighted by the UniProt Consortium, see http://www.uniprot.org/terms 

CC Distributed under the Creative Commons Attribut ion-NoDerivs License 

CC 

DR EMBL; V01555; CAA24801.1; -; Genomic_DNA. 

DR PIR; A03798; QQBE3R. 

DR PDB; 106E; X-ray; A/B=l-235. 

DR MEROPS; S21.0 03; -. 

DR InterPro; IPR001847; Pept idase_S2 1 . 

DR Gene3D; G3DSA: 3 . 20 . 16 . 10 ; Pept idase_S2 1 ; 1. 

DR Pfam; PF00716; Pept idase_S2 1 ; 1. 

DR PRINTS; PR00236; HSVCAPSIDP40 . 

PE 1: Evidence at protein level; 

KW 3D-structure ; Alternative initiation; Capsid protein; DNA packaging; 
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SQ 


SEQUENCE 


605 AA; 


64102 MW; FC2D355F8A389708 CRC64; 


Alignment Scores 








Pred. 


No. : 




2e-88 


Length: 605 


Score : 




1894.00 


Matches: 345 


Percent Similarity: 


100 . 0% 


Conservative : 0 


Best 


Local Similarity: 


100.0% 


Mismatches: 0 


Query Match: 




98.2% 


Indels: 0 


DB: 






1 


Gaps: 0 


US-10-036-729-3 


(1-1038) 


x VP40_ 


EBV (1-605) 



Qy 1 ATGCTATCAGGTAACGCAGGAGAAGGAGCAACAGCCTGCGGAGGTTCGGCCGCCGCGGGC 6 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 261 MetLeuSerGlyAsnAlaGlyGluGlyAlaThrAlaCysGlyGlySerAlaAlaAlaGly 280 

Qy 61 CAGGACCTCATCAGCGTCCCCCGCAACACCTTTATGACACTGCTTCAGACCAACCTGGAC 12 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 281 GlnAspLeuIleSerValProArgAsnThrPheMetThrLeuLeuGlnThrAsnLeuAsp 300 



Qy 121 AACAAACCGCCGAGGCAGACCCCGCTACCCTACGCGGCCCCGCTGCCCCCCTTTTCCCAC 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 301 AsnLysProProArgGlnThrProLeuProTyrAlaAlaProLeuProProPheSerHis 320 

Qy 181 CAGGCAATAGCCACCGCGCCTTCCTACGGTCCTGGGGCCGGAGCGGTCGCCCCGGCCGGC 2 4 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 321 GlnAlalleAlaThrAlaProSerTyrGlyProGlyAlaGlyAlaValAlaProAlaGly 3 40 

Qy 2 41 GGCTACTTTACCTCCCCAGGAGGTTACTACGCCGGGCCCGCGGGCGGGGACCCGGGTGCC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3 41 GlyTyrPheThrSerProGlyGlyTyrTyrAlaGlyProAlaGlyGlyAspProGlyAla 36 0 

Qy 3 01 TTCTTGGCGATGGACGCTCACACCTACCACCCCCACCCACACCCCCCTCCGGCCTACTTT 36 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 PheLeuAlaMetAspAlaHisThrTyrHisProHisProHisProProProAlaTyrPhe 380 

Qy 361 GGCTTGCCGGGCCTCTTTGGCCCCCCTCCACCCGTGCCTCCTTACTACGGATCCCACTTG 420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 381 GlyLeuProGlyLeuPheGlyProProProProValProProTyrTyrGlySerHisLeu 40 0 

Qy 421 CGGGCAGACTACGTCCCCGCTCCCTCGCGATCCAACAAGCGGAAAAGAGACCCCGAGGAG 480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 401 ArgAlaAspTyrValProAlaProSerArgSerAsnLysArgLysArgAspProGluGlu 42 0 

Qy 481 GATGAAGAAGGCGGGGGGCTATTCCCGGGGGAGGACGCCACCCTCTACCGCAAGGACATA 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 AspGluGluGlyGlyGlyLeuPheProGlyGluAspAlaThrLeuTyrArgLysAspIle 440 

Qy 541 GCGGGCCTCTCCAAGAGTGTGAATGAGTTACAGCACACGCTACAGGCCCTGCGCCGGGAG 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 441 AlaGlyLeuSerLysSerValAsnGluLeuGlnHisThrLeuGlnAlaLeuArgArgGlu 460 

Qy 601 ACGCTGTCCTACGGCCACACCGGAGTCGGATACTGCCCCCAGCAGGGCCCCTGCTACACC 66 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 461 ThrLeuSerTyrGlyHisThrGlyValGlyTyrCysProGlnGlnGlyProCysTyrThr 48 0 

Qy 661 CACTCGGGGCCTTACGGATTTCAGCCTCATCAAAGCTACGAAGTGCCCAGATACGTCCCT 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 HisSerGlyProTyrGlyPheGlnProHisGlnSerTyrGluValProArgTyrValPro 500 

Qy 721 CATCCGCCCCCACCACCAACTTCTCACCAGGCAGCTCAGGCGCAGCCTCCACCCCCGGGC 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 501 HisProProProProProThrSerHisGlnAlaAlaGlnAlaGlnProProProProGly 520 

Qy 781 ACACAGGCCCCCGAAGCCCACTGTGTGGCCGAGTCCACGATCCCTGAGGCGGGAGCAGCC 8 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 521 ThrGlnAlaProGluAlaHisCysValAlaGluSerThrlleProGluAlaGlyAlaAla 540 

Qy 8 41 GGGAACTCTGGACCCCGGGAGGACACCAACCCTCAGCAGCCCACCACCGAGGGCCACCAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 GlyAsnSerGlyProArgGluAspThrAsnProGlnGlnProThrThrGluGlyHisHis 56 0 

Qy 9 01 CGCGGAAAGAAACTGGTGCAGGCCTCTGCGTCCGGAGTGGCTCAGTCTAAGGAGCCCACC 96 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 561 ArgGlyLysLysLeuValGlnAlaSerAlaSerGlyValAlaGlnSerLysGluProThr 58 0 

Qy 961 ACCCCCAAGGCCAAGTCTGTGTCAGCCCACCTCAAGTCCATCTTTTGCGAGGAATTGCTG 102 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 581 ThrProLysAlaLysSerValSerAlaHisLeuLysSerllePheCysGluGluLeuLeu 600 



1021 AATAAACGCGTGGCT 1035 
I I I I I I I I I I I I I I I 
601 AsnLysArgValAla 605 



